同期两篇Science | 人工智能革新蛋白质设计:准确而快速地创造蛋白质
在过去的两年里,机器学习彻底改变了蛋白质预测和设计的研究进展。7月28日,Alphabet旗下DeepMind公司表示,AlphaFold已经预测了全球几乎所有的蛋白质结构,其蛋白质结构数据库中的数据从200万个扩增到超2亿个。AlphaFold是继AlphaGo之后,DeepMind重磅打造的一款智能人工系统,主要被用于预测蛋白质结构。
但先进如AlphaFold也只能预测天然蛋白质结构,如何从头设计全新的功能性蛋白质分子仍是生物学研究的一个挑战。深度学习生成方法提供了广泛探索天然蛋白质之外的蛋白质结构的机会。
9月15日,科学突破奖获得者、华盛顿大学医学院David Baker教授团队在国际顶级期刊Science上同期发表两篇文章“Robust deep learning–based protein sequence design using ProteinMPNN”和“Hallucinating symmetric protein assemblies”。Baker团队开发了一种基于深度学习的蛋白质序列设计方法ProteinMPNN。结果显示,ProteinMPNN的序列回收率为52.4%,具有广泛的实用性和高准确性。两项研究成果表明,机器学习可以用于创建蛋白质分子,且更加准确快速。
Baker教授表示:“蛋白质是生物学研究的基础。但我们知道,目前在植物、动物和微生物中发现的蛋白质远不到所有蛋白质的1%。有了这些新的软件工具,研究人员能够找到解决医学、能源和技术中长期挑战的更多方法。”
图:使用ProteinMPNN设计蛋白质的细节,来源:Ian Haydon, UW Medicine Institute for Protein
图:ProteinMPNN产生了对称的纳米环形结构蛋白质组合。来源:Ian Haydon, UW Medicine Institute for Protein
图:超快速软件工具ProteinMPNN设计的蛋白质更有可能按预期折叠。来源:Ian Haydon, UW Medicine Institute for Protein
参考资料:
1.Robust deep learning–based protein sequence design using ProteinMPNN. SCIENCE, 2022. DOI: 10.1126/science.add2187
https://www.science.org/doi/10.1126/science.add2187
2.Hallucinating symmetric protein assemblies. SCIENCE, 2022.
3.
热文推荐
华中科技大学郭安源教授团队首次鉴定单个细胞外囊泡中的RNA特征
74种疾病130万个细胞!scRNA-seq与多基因疾病风险联合揭示单细胞疾病相关性
研究证实cfDNA中含有肿瘤特异性TF结合信息,可利用血浆绘制肿瘤调控图谱
专访华大智造蒋慧博士、单日强先生:硬件软件双重核心工具助力大人群基因组研究
喜欢就点个“在看”吧